鲲鹏AI推理加速型 |
您所在的位置:网站首页 › 华为云 cloud for ai › 鲲鹏AI推理加速型 |
鲲鹏AI推理加速型云服务器是专门为AI业务提供加速服务的云服务器。搭载昇腾系列芯片及软件栈。 该类型弹性云服务器默认未开启超线程,每个vCPU对应一个底层物理内核。 鲲鹏AI推理加速型系列:搭载自研昇腾310芯片,为AI推理业务加速。 表1 鲲鹏AI推理加速型实例特点规格名称 计算 磁盘类型 网络 鲲鹏AI推理加速增强I型kAi1s CPU/内存配比:1:1/1:2 vCPU数量范围:4-48 处理器:鲲鹏920处理器 基频:2.6GHz 高IO 通用型SSD 超高IO 极速型SSD 通用型SSD V2 超高网络收发包能力 实例网络性能与计算规格对应,规格越高网络性能越强 最大网络收发包:200万PPS 最大内网带宽:12Gbps 鲲鹏AI推理加速增强I型kAi1s概述 鲲鹏AI推理加速型实例kAi1s是以昇腾310(Ascend 310)芯片为加速核心的AI加速型弹性云服务器。基于Ascend 310芯片低功耗、高算力特性,实现了能效比的大幅提升,助力AI推理业务的快速普及。通过AI推理加速型实例kAi1s将Ascend 310芯片的计算加速能力在云平台上开放出来,方便用户快速简捷地使用Ascend 310芯片强大的处理能力。 鲲鹏AI推理加速型实例kAi1s基于Atlas 300I加速卡设计,更多详细信息请参考昇腾社区。 鲲鹏AI推理加速型云服务器可用于机器视觉、语音识别、自然语言处理通用技术,支撑智能零售、智能园区、机器人云大脑、平安城市等场景。 规格 表2 kAi1s型弹性云服务器的规格规格名称 vCPU 内存 (GiB) 最大带宽/基准带宽 最大收发包能力 (万/PPS) 网卡多队列数 网卡个数上限 Ascend 310个数 虚拟化类型 kai1s.xlarge.1 4 4 3/0.8 20 2 2 1 KVM kai1s.2xlarge.1 8 8 4/1.5 40 2 3 2 KVM kai1s.4xlarge.1 16 16 6/3 80 4 4 4 KVM kai1s.3xlarge.2 12 24 8/4 100 4 4 4 KVM kai1s.4xlarge.2 16 32 10/6 140 4 5 6 KVM kai1s.6xlarge.2 24 48 12/8 200 8 6 8 KVM kai1s.9xlarge.2 36 72 12/8 200 8 6 12 KVM kai1s.12xlarge.2 48 96 12/8 200 16 6 12 KVM 功能 kAi1s加速型弹性云服务器功能如下: 处理器与内存配比为1:1/1:2。 处理器:Kunpeng 920 2.6GHz。 支持Ascend310芯片,每张Atlas 300I加速卡包含4个Ascend310芯片。 单芯片半精度(FP16)8TeraFLOPS。 单芯片整数精度(INT8)16TeraOPS。 单芯片提供8GiB显存,内存带宽50GiB/s。 内置硬件视频编解码引擎, 支持H.264/265。使用须知 kAi1s实例支持如下版本的操作系统: Ubuntu Server 18.04 64bit CentOS 7.6 64bit kAi1s型云服务器所在物理机发生故障时,云服务器支持自动恢复。如何使用kAi1s加速型云服务器 购买与使用kAi1s加速型云服务器的流程如下: 创建云服务器,详细步骤,请参考步骤一:基础配置。 在“规格”设置时,选择kAi1s加速型相关规格。 在“镜像”设置时,可以选择“公共镜像”和“私有镜像”。 公共镜像:已经默认安装了CANN 3.1.0的开发套件包,并配置了环境变量,请验证环境的可用性。 私有镜像:需要安装驱动、固件和开发套件,并配置环境变量。详细步骤,请参考昇腾文档中心对应版本的《CANN软件安装指南》。 远程登录云服务器。对于Linux操作系统的云服务器,登录时请以SSH密码方式登录。具体操作,请参见密码方式登录Linux弹性云服务器(SSH方式)。 验证环境可用性。请参考昇腾文档中心中对应CANN版本《应用开发指南》中的“样例使用指导”,选择一个样例进行编译运行,验证环境的正确性。 例如,选择“基于Caffe ResNet-50网络实现图片分类(图片解码+缩放+同步推理)”样例进行验证。 相关链接昇腾文档中心:为开发者提供昇腾常用开发工具,帮助您学习和使用昇腾。 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |